AI资讯新闻榜单内容搜索-Efficiency

1/10 消耗、0.1美元定价，开发者和中小企业的“省钱模型”来了

4月22日，蚂蚁百灵正式推出Ling-2.6-flash Instruct模型。该模型总参数量为104B，激活参数仅7.4B，核心主打高“Token 效率（Token Efficiency）”。API定价方面，Ling-2.6-flash输入每百万tokens定价0.1美元，输出 0.3 美元。目前，Ling-2.6-flash API已在OpenRouter及百灵tbox平台上线。

来自主题: AI资讯

8441 点击 2026-04-23 17:09

突破一亿Token极限：EverMind提出MSA架构，实现大模型高效端到端长时记忆

人的智能能力主要由推理能力和长期记忆能力构成。近年来，大模型的推理能力一直处于快速发展过程，但大模型的长期记忆能力一直受限于上下文长度，无法取得突破。在历史上，曾经有多种路线进行尝试，但都无法突破扩展性（Scalability）、精度（Precision）和效率（Efficiency）的不可能三角。

来自主题: AI技术研报

10432 点击 2026-03-19 17:02

Efficiency Law, 物理精确世界模型，及世界模型引擎驱动的具身智能学习新范式

2025 年秋的具身智能赛道正被巨头动态点燃：特斯拉上海超级工厂宣布 Optimus 2.0 量产下线，同步开放开发者平台提供运动控制与环境感知 SDK，试图通过生态共建破解数据孤岛难题；英伟达则在 SIGGRAPH 大会抛出物理 AI 全栈方案，其 Omniverse 平台结合 Cosmos 世界模型可生成高质量合成数据，直指真机数据短缺痛点。

来自主题: AI技术研报

10108 点击 2025-10-27 17:05